УЧЕТ ИСКАЖЕНИЯ ИНФОРМАЦИИ В ЗАДАЧАХ НАВЕДЕНИЯ
Как показано в третьей главе, оптимальное управление является безынерционной функцией текущей оценки
фазовых координат объекта x(t), на основе измеренных значений вектора г.
Когда наблюдаемый вектор z определяется выражением
z(t)=Cx(t)—n{t), (5.117)
где С — прямоугольная матрица (ІХп), являющаяся известной функцией времени; n(t) —вектор белых шумов с уровнем N (t); x(t) — вектор фазовых координат линей — ного объекта, оденки фазовых координат определяются уравнениями:
Ax{t)+Bu + R{t)CTN~’ [z{t) — Cx(t), (5.118) x(to)=Mx0i
A£-=AR + RAT-RCTN-‘CR-{-$(t), (5.119)
В системах телеуправления информация о текущих значениях вектора x(t) может искажаться це*>ю, создающей помехи. В связи с этим изменяется и зависимость
текущей оценки x(t) от вектора z(t). Задача учета искажений информации при приеме сводится к получению
выражений, связывающих x(t) с z(t) в случаях, когда связь z (t) с x(t) отличается от условия (5.117).
Предположим в общем случае, что наблюдаемый вектор z(t) определяется выражением
z{t)=y{t)+n{t ] (5.120)
где вектор y(t) случайно связан с вектором фазовых координат x(t) объекта управления. Пусть известен условный закон распределения у (і) при заданном *(0. Р(у1х), который не зависит от прошлой информации z(x),x<t и имеет конечные первый и второй моменты. В этом случае по формуле условных вероятностей имеем
Р(г,1х,)=§ PiZtlyJPiyt/xJdy,. (5.121)
sy
Если n(t) подчиняется нормальному закону распределения с нулевым математическим ожиданием, то для момента имеем
Разложим выражение (5.122) в ряд по At—U — и подставим его в равенство (5.121). При конечных первом и втором моментах
5 УіРІУіІхі)аУі=Мхі)> (5.123)
ЯУ
Г yi!/ip{yi/xi)dy,=^%(xt) (5.124)
выражение (5.121) может быть представлено в виде
где 0 {At) означает члены более высокого по сравнению с At порядка малости.
Получим для этого случая уравнение, определяющее апостериорный закон распределения фазовых координат объекта x(ti) при наблюдении вектора г на интервале (/о, ti), где і принимает целые значения.
Обозначая через
Pi(*t)=.P(*il* о) (5.126)
апостериорный закон распределения x(ti) при наблюдениях г на интервале {to, U) и через
Я,_і(*,_і)=/>(*,-іДггі-1) (5.127)
этот закон распределения на предыдущем шаге. По формуле Байеса получим
Pi i. Xl) = kiP (zJXi, 2o~l) J P(Xi/X,-U zt’ix
8 (■»/-!)
XPi-x(.Xi-x)dxt-r, (5.128)
где ki — коэффициент нормировки;
Q (лгг—і)—область возможных значений вектора x{ti-1).
На основании предположения о независимости условного знакона Уі от прошлых наблюдений и некоррелированности значений шума n(ti) в разные моменты времени, получаем _
P(*i/x„ Zb~l)=P(*ilxt). (5.129)
|
|
Sp — след матрицы, р,] и рг определяются выражениями (5.123) и (5.124); N — уровень белого шума n(t).
В качестве начального условия в уравнении (5.135) используется априорный закон распределения фазовых координатх в момент t0, равный Р(х0). Уравнение (5.135) может быть решено в общем виде с помощью обычного метода характеристик, применяемого для дифференциальных уравнений в частных производных первого порядка.
Из уравнения (5.130) следует
х (t0)=kT(f, t0)x(t)— f kT(xt Q 4u{x)dx, (5.137)
*0
гpekT(t, t0) —импульсная переходная матрица системы сопряженной (5.130). Поэтому
Р(х, /)=P0|V(<, і0)х(і)—^кт{х, t0)Bu{x)dx, X X exp I — I* [kT (t, x) x (t) — (5.138)
l to
— j kT ((*., т) Чи (p) flip, t] dtI,
где Po — априорный закон распределения Xo в момент to — Подынтегральное выражение в показателе экспоненциальной функции является результатом замены в формуле (5.136) функции х(т) в pi и р2 их выражениями при А)=т. Поскольку в выражение (5.136) входят средние значения искомого распределения, окончательное решение может быть получено после определения
Мг= f РіДО/Ч*. t)dx, (5.139)
•/W2=f р2(х) Р (х, t)dx (5.140)
К
и решения алгебраической системы уравнений относительно Мі и М%. Зная Р(х, t), апостериорное математи
ческое ожидание фазовой координаты объекта x(t) можно определить из выражения
x(t)=j хР(х, t)dx. (5.141)
Полученные выражения дают принципиальную возможность решения задачи оптимального управления при действии мультипликативных помех, однако фактическое получение решения сопряжено с вычислительными трудностями.
Рассмотрим возможность применения уравнения (5.135) к задачам управления при действии помех.
Предположим, что цель имеет возможность создавать помехи, исключающие прием полезного сигнала x(t) наводящимся объектом на некоторых интервалах внутри (*о, *»). Такое положение имеет место, когда происходит прекращение поступления информации о положении цели вследствие действия помех [22].
Если принять, что срывы сопровождения происходят в известные моменты времени, то решение может быть получено приравниванием к нулю элементов матрицы С в (5.118) и (5.119) на интервалах прекращения сопровождения. В частности, если
С (<)=0 <*</«, (5.142)
то из выражений (5.118) и (5.119) следует, что на этом интервале
—= АхЛ)+Ви (5.143)
dt
-=AR-YRAr+S(t) (5.144)
dt
при заданцых^лг^^и R (/J.
Уравнения (5.143) и (5.144) соответствуют априорным оценкам вектора *(г).при отсутствии наблюдений. Таким образом, если матрица С(^)=0, то обработка информации в системе наведения эквивалентна прекращению приема вектора г и переходу к априорным оценкам фазовых координат объекта. При этом в качестве начальных значений принимают оценки, имевшие место в последний момент получения информации.
. Заметим, что подобный результат имеет место также в случае, когда уровень белого шума л(^), равный N, неограниченно возрастает.
Фактически в системе наведения осуществляется при этом пролонгация координат цели на основе априорной гипотезы о ее движении.
Другим предельным случаем является представление элементов матрицы С в виде случайных процессов, значения которых в разные моменты времени независимы и равны 0 с вероятностью и единице с вероятностью 1 —Яі-
В этом случае вектор z может быть представлен в виде
z=Cax—n(t), у(х)=Сах, (5.145)
где a(t) диагональная матрица (пХп) с0 Случайными элементами а, ц (/), подчиняющимися закону распределения с плотностью:
P>jj (О=Яі {t) § l*J} (t)] + [ 1 — qj (t)] 8 [ajj (t)- I], (5.146)
где 6[ajj] — дельта-функция. Если кроме того, считать ajj (t) независимыми для разных / в один и тот же момент, то совместный закон распределения а(/) равен произведению законов распределения каждого элемента и
^«(0=П^(0- (5.147)
i-i
Положим для простоты а (і) скалярной функцией, что соответствует одновременному обращению в нуль всех элементов векторах^) с вероятностью q(t). В этом случае в уравнении (5.135) функция (5.136) может быть записана в виде
F (х, t)=SpA + Я-=±- [xTCTN~’Сх-Sp(CTN~’С X
X Dx (*))]-(1 — q)(x-xYCTN-‘z. (5.148)
Сравним равенство (5.148) с выражением функции
р(х, t) при неслучайной матрице С, которое имеет место при
Яс(С)=8(С-Сх) (5.149)
Fc (х, t)=SpA +-І — [xTClN-VCjX — — Sp(ClTV"1 C1PX{t)-Lx-xJCx N~’z. (5.150)
Отсюда следует, что выражение (5.148) и (5.150) совпадают, если в формуле (5.150) уровень ошибок измерений увеличить в 1/1 — q раз.
Поскольку математическое ожидание и дисперсионная матрица x(t), соответствующие формуле (5.150), удовлетворяют уравнениям (5.118) и (5.119), оценка текущих фазовых координат х в условиях, когда полезная информация в наблюдаемом векторе z(t) становится равной нулю с вероятностью q(t) независимо от прошлых моментов времени, удовлетворяет уравнению
-£-= Лх(/)+*#(i) + R (/)CTN~X (1 — q)[z{t)-Cx(*)].
at
(5.151)
При этом
— = AR—RAT-RCTN~'(l-q)CR. (5.152)
dt
Таким образом, в рассматриваемом случае оценка *(£) сводится к оценке без потери информации при увеличении уровня N белого шума ошибок измерений в 1/1 — q раз.
Рассмотрим также случай, когда
(5.153)
где С — случайная матрица с известным законом распре-
деления Рс(с), в общем случае зависящим от времени.
В этом случае функции р(х, і) (5.136) примет вид
CTN~xCPc (C)dC-x-
-{x-xf CTPc{C)dC-N~’z. (5.154)
Р2х= I" ххтР(х, t)dx (5. 155)
V
= хР(х, t)dx (5. 156)
Пс, Q* — области возможных значений x(t) и С.
Будем искать в этом случае решение (5.135) в виде
Р(х, t)=kexр—l-[(x-x)TD~1 (лг-jc)]. (5.157)
Подставляя выражения (5.157) и (5.136) в (5.135) и приравнивая коэффициенты при степенях х нулю, получим
= Ах + Ви + D ^ СтРс (С) dCN~l z —
— j CTN~’CPc{C)dC-x) (5.158)
и D=AD + DAT-D j CTN~’CPc{C)dC-D. (5.159)
Из сравнения этих выражений с формулами (5.118) и (5.119) следует, что если матрица С случайна с известным законом распределения Рс, то оценки текущих координат объекта совпадают с оценками для детерминированной матрицы С при замене С и CTN~lC математическими ожиданиями.
1.